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WE: WRKY 转录 因子 是 植物 信号 网 络 中 不 可 缺少 的 部 分 ， 作 为 植物 中 最 大 的 转录 因子 家 族 之 
一 ， 在 植物 的 多 种 应 激 反应 中 发 挥 重 要 作用 。 利 用 生物 信息 学 方法 对 中 粒 咖啡 WRKY 蛋白 家 族 
的 理化 特性 及 其 分 子 进化 进行 了 详细 的 分 析 。 结 果 表 明 : CcWRKY 和 蛋白 氨基 酸 数 量 在 103-994 
个 之 间 ， 均 无 信号 肽 ， 推 测 其 为 非 分 泌 性 蛋白 。 其 二 级 结构 以 无 规则 卷曲 为 最 主要 的 结构 元 件 ， 
三 级 结构 主要 分 为 6 类 ， 其 中 以 CcWRKY61、CcWRKY72、CcWRKY6 和 CcWRKY7 为 主要 成 
员 的 DD 类 结构 最 稳定 。 保 守 结 构 域 及 进化 树 分析 表 明 中 粒 咖啡 WRKY 基因 家 族 含 有 49 个 成 员 ， 
其 中 的 10 个 成 员 归 为 WRKY 第 工 家 族 ，34 个 成 员 归 为 WRKY 第 开 家 族 ，5 个 成 员 归 为 WRKY 第 
II 家 族 。 中 粒 咖 啡 WRKYI 基因 与 其 他 物种 的 系统 进化 分 析 结 果 表 明 其 WRKYI 与 烟草 亲缘 关系 最 
近 ， 与 非洲 油 棕 (Elaeis guineensis) 亲 缘 关 系 最 远 ， 说 明 WRKY1 蛋白 在 生物 进化 过 程 中 还 是 比较 
保守 的 。 该 文 研究 结果 可 以 为 中 粒 咖啡 WRKY 基因 家 族 的 分 子 功能 的 深层 次 研究 提供 一 定 的 借鉴 
作用 ， 对 进一步 探究 中 粒 咖啡 WRKY 基因 的 功能 、 进 化 以 及 分 子 育种 具有 重要 的 现实 意义 。 
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Abstract: WRKY transcription factor is an indispensable part of plant signal network. As one of the 
largest family of transcription factors in plants, WRKY transcription factor plays an important role in 
various stress responses of plants. The physicochemical properties and molecular evolution of WRKY 
protein family of Coffee canephora were analyzed in detail by bioinformatics methods. The results 
showed that the amino acids numbers of WRKY proteins were from 103 to 994, and there was no signal 
peptide. It is presumed to be a non-secretory protein. Random coil is the most important structural 


element in the secondary structure of its WRKY proteins. The tertiary structure of WRKY proteins were 
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mainly divided into six categories. Among them, the D-class structure with CCWRKY61, CcWRKY72, 
CcWRKY6 and CcWRKY?7 as the main members is the most stable. Conserved domain and 
phylogenetic tree analysis indicated that the WRKY gene family in C. canephora contains 49 members, 
10 of which are classified as WRKY class I, 34 members are classified as WRKY class II, and 5 members 
are classified as WRKY class III. The phylogenetic analysis of WRKYI gene of C. canephora and other 
species showed that WRKY] of C. canephora was the most closely related to tobacco and the most 
distant to Elaeis guineensis, indicating that WRKY 1 protein is relatively conservative in the process of 
biological evolution. The results of this study can provide some reference for the further study of the 
molecular function of WRKY gene family of Coffea Canephoea, and have important practical 
significance for further exploration of the function, evolution and molecular breeding of WRKY gene in 
C. canephora. 
Key words: Coffee canephora, WRKY, transcription factor, phylogenetic evolution, bioinformatics 
粒 咖 啡 (Cojfee canephora) 的 年 平均 产量 和 产值 均 达 到 三 大 饮料 作物 之 首 ， 而 且 其 消费 量 也 
居 第 一 ( 闫 林 等 ，2018)。 它 作为 一 种 重要 的 提神 饮料 已 有 成 百 上 和 干 年 的 历史 ， 是 国际 贸易 中 非常 
重要 的 的 原料 产品 (Davis et al., 2011; Monente et aL, 201$)。 中 粒 咖 啡 是 属于 苦 草 科 咖 啡 属 的 一 包 
小 乔木 或 灌木 。 咖 啡 属 植物 共 100 多 种 ， 而 生产 性 栽培 的 主要 为 小 粒 种 和 中 粒 种 ， 分 别 占据 世界 
咖啡 产量 的 60% 和 4096. 2014 年 ， 海 南 以 种 植 中 粒 种 咖啡 为 主 ， 咖 啡 种 植 面积 占 全 国 的 0.47% 
(Rodrigues et al., 2015; 闫 林 等 ,2018)。 中 粒 种 咖啡 理想 的 种 植 环境 是 在 气温 高 并 且 降 雨量 丰沛 的 
地 方 ， 然 而 ， 在 中 粒 咖啡 的 栽培 过 程 中 经 常会 遭遇 病害 、 干 旱 和 低温 等 胁迫 ， 严 重 影响 了 生长 发 
育 ， 给 生产 带 来 重大 损失 ( 杨 华 康 ，2014)。 
在 植物 中 , WRKY 蛋白 是 一 种 普遍 存在 的 基因 超 家 族 转录 因子 , 是 植物 科学 研究 中 最 多 的 一 
种 转录 因子 ， 归 属于 高 等 植物 的 10 大 超 家 族 转录 因子 ( 郑 超 等 ，2018)。WRKY 因 其 家 族 所 有 成 员 
的 NN mHE A h WRKYGQK 7 个 氨基 酸 组 成 的 保守 序列 而 得 名 , 依据 其 特点 , 将 植物 中 的 WRKY 
基因 超 家 族 ( 李 智 等 , 2019) 划 分 为 3 个 家 族 : T. ILI III( 郑 超 等 , 2018)。 第 I 家 族 具有 2 个 WRKY 
域 和 1 个 锌 指 结 构 为 C2H2(C-X4-5-C-X22-23-H-X1-H) (其 中 X 可 以 表示 任 一 氨基 酸 )， 第 I 家族 
是 具有 1 个 WRKY 域 和 1 个 以 C2H2(C-X4-5-C-X22-23-H-X1-H) 为 代表 的 锌 指 结构 域 组 成 的 ， 第 
II 家 族 是 由 1 个 WRKY Jf C2HC 型 锌 指 结构 (C-X7-C-X23-H-X1-C) 组 成 (Bakshi et al., 2014)。 
Ishiguro & Nakamura(1994) 首 次 在 甘薯 (1pomoea batatas) 克 隆 首 个 WRKY 基因 并 鉴定 了 1 个 DNA 
binding 和 蛋白， 命名 为 SPF7 转录 因子 。 随 后 在 不 同 的 作物 中 死 隆 和 鉴定 到 了 大 量 的 WRKY 转录 因 
子 ， 包 括 : 万 麻 (56 个 WRKY KNER, 2013) DARBE 个 WRKY 基因 )( 包 昌 艳 等 ，2018)、 
番茄 (81 个 WRKY 基因 )( 张 红 ，2017)、 葡 萄 (56 个 WRKY 基因 )( 苏 玲 等 ， 2019) 和 杰 (92 个 WRKY 
因 )( 薛 宝 平等 ，2018) 等 。 
WRKY 转录 因子 是 一 类 植物 特有 的 转录 因子 ， 它 参与 植物 种 子 解除 休眠 、 代 谢 和 激素 信号 转 
导 等 调控 ( 谢 政文 等 ，2016)。 在 很 多 植物 的 发 育 和 生理 过 程 中 具有 转录 激活 或 转录 抑制 的 功能 
(Rushton et al., 2010; Rushton et al., 2012; Ding et al., 2015)。 有 研究 分 析 指 出 ，WRKY 基因 家 族 在 
盐 胁 迫 、 高 温 、 低 温和 干旱 等 应 管 非 生物 胁迫 条 件 下 起 到 了 非常 重要 的 作用 (Jiang et al., 2006; Wu 
et al., 2009; 李 晓 颖 等 ,2019)。 也 有 研究 报道 WRKY 转录 因子 在 植物 的 生长 发 育 过 程 中 发 挥 作用 。 
比如 果实 成 熟 (Xu et al., 2004)、 胚 胎 发 育 (Lagacé et al., 2004) 和 衰老 (Robatzek et al., 2010; 张 柳 等 ， 
2019) 等 。 在 猕猴 桃 中 有 33 个 WRKY 基因 在 植物 根 、 叶 、 花 和 果 4 个 器 官 中 均 有 显著 性 表达 ( 包 昌 
艳 等 ，2018); 在 苹果 WRKY 基因 家 族 研究 中 得 到 有 12 个 MaWRKY HER E. h EMRE 
表达 ， 可 能 参与 调控 苹果 生长 和 发 育 等 过 程 ( 张 柳 等 ，2019); 在 烟草 :云烟 87? 叶 片 衰老 中 WRKY 
转录 因子 研究 中 指出 ，N1WRKYI11 NtWRKY31, NtWRKY40 和 NtWRKY51 与 逆境 胁迫 相关 ， 又 在 
叶片 衰老 中 起 到 交叉 作用 ( 谷 彦 冰 等 ，2015)， 目 前 为 止 ， 在 中 粒 咖啡 转录 因子 中 ， 有 对 TPS 基因 
家 族 进 行 了 系统 分 析 ( 程 甜 等 ，2016)， 而 对 WRKY 基因 家 族 研 究 甚 少 ，Dong et al.(2019) 对 中 粒 咖 
啡 全 基因 组 鉴定 了 49 个 CcWRKYS， 并 研究 了 其 对 寒冷 胁迫 的 响应 。 本 研究 将 通过 生物 信息 学 的 
方法 对 中 粒 咖啡 WRKY 转录 因子 的 氨基 酸 的 组 成 、 跨 膜 结构 域 、 保 守 基 序 、 和 蛋白 的 高 级 结构 分 析 


E 
Ir 
ET 


5 


以 及 与 烟草 、 猕 猴 桃 、 水 稳 等 物种 的 亲缘 关系 进行 预测 和 分 析 ， 为 进 一 


WRKY 转录 因子 的 功能 
1 材料 与 方法 
1.1 试验 材料 


ZU ETE 


定 的 理论 依据 。 


步 探索 与 生物 逆境 相关 的 


从 植物 转录 因子 数据 库 (http:/planttftdb.cbi.pku.edu.cn/index.php)( 数 据 库 版 本 为 V5.0) 获 取 中 粒 


咖啡 (Coffea canephora), 


水 稻 (Oryza sativa subsp. indica). 


玉米 (Zea mays)、 独 猴 桃 (Actinidia 


chinensis)、 烟 草 (Nicotiana tabacum)、 板 票 (Castanea mollissima), FEIR (Elaeis guineensis)、 小 


TR HT Æ (Musa acuminata)、 


因 家 族 成 员 的 对 应 关系 ( 表 1)。 
1.2 方法 
1.2.1 WRKY 家 族 成 员 编码 蛋 上 


运用 PrtoParam 在 线程 序 分 析 了 CCWRKY £&& 


水 性 及 带 
al., 2006; 沙 桐 等 ， 
细胞 定位 分 析 。 
1.2.2 氨基 酸 的 跨 膜 结构 、 


RKI 


2019) 分 别 对 49 条 中 粒 咖啡 WRKY 


Æ 11 (Phyllostachys heterocycla) ~ 
domestica) NAFA 7r (Arabidopsis thaliana)x 12 个 物种 的 WRKY 转录 因子 家 族 的 核 
酸 序列 。 通 过 Blastp 程序 比 对 拟 南 芥 WRKY 蛋白 序列 找 出 中 粒 咖啡 转录 因子 WRKY(CcWRKY) 基 


理化 性 质 分 析 


X (Ziziphus jujuba). “Ë R (Malus 
TER FE JUS SUAE 


ERHALTEN, BEARRKE, AFRA 
正 负 电荷 氨基 酸 数量 等 指标 的 相关 预测 。 利用 在 线 软件 SignalP-5.0 和 CELLO v2.5(Yu et 


磷酸 化 位 点 及 保守 基 月 
在 TMHMM Server v.2.0 在 线 软件 ( 周 洁 等 ，2018) 输 入 中 粒 咖 啡 WRKY 蛋白 序列 ， 


基因 家 族 的 氨基 酸 序 列 进行 信 


号 肽 预测 和 亚 


预测 
DIZE 


白 家 族 的 跨 膜 结 构 。 通 过 Protscale Æ RAH EARR KEMT. Æ NetPhos3.1 Server 
Chttp:Wwww.cbs.dtu.dkyservicesNetPhos/) 对 中 粒 咖啡 WRKY 和 蛋白 序列 潜在 磷酸 化 位 点 进行 预测 分 


析 。 利 用 MEME 5.0.4 ERT 


序 个 数 为 10， 其 他 参数 为 默认 设置 。 


4r T ' 


1.2.3 蛋白 质 的 二 级 结构 和 三 级 结构 预测 
利用 SOPMA 在 线 网 站 预测 

周 洁 等 ，2018)。 利 

析 。 


1.2.4 中 粒 咖 啡 WRKY 基因 家 族 系 统 发 育 树 的 构建 

利用 MEGA7.0 软件 ( 王 鹏 洋 等 , 2019) 对 CCWRKY 蛋白 序列 进行 多 重 比 对 并 构建 其 系统 发 育 
烟草 、 猕 猴 桃 、 板 票 、 苹 果 和 玉米 等 12 
系统 发 育 树 的 构建 ， 采 用 邻接 法 (Neighbor-Joining) 构 建 系统 发 育 树 (Saitou et al., 
E， 校 验 参 数 Bootstrap 重复 1 000 次 ， 得 到 最 终 


树 ， 并 且 对 中 粒 咖啡 、 拟 南 芥 、 
序列 进行 


Kumar et al., 2018)， 对 生成 的 系统 发 


的 系统 发 育 树 。 
2 结果 与 分 析 


育 树 进行 校 了 


有 具 搜索 中 粒 咖 啡 WRKY 基因 家 族 成 员 的 Motif, 


粒 咖啡 49 F 


] Phyre 2(Kelley et al., 2015) 网 站 对 


2.1 中 粒 咖 啡 WRKY 蛋白 一 级 结构 和 理化 特性 


运用 在 线程 序 PrtoParam( 周 洁 等 ，2018; EIES 
有 49 个 成 员 ， 将 这 些 成 员 的 蛋白 一 级 结 
因 家 族 的 蛋白 的 氨基 酸 


录 因 子 WRKY 
分 析 。 


基因 家 族 中 的 共 


结果 表示 ， 中 粒 咖 啡 WRKY 基因 
为 376 个 。 多 数 为 酸性 和 蛋白质 ,只 有 19 个 成 员 的 理 t 
和 Cc10. 06400 为 稳定 蛋白 , 其 余 均 为 不 稳定 蛋 E 


员 的 带 负 电荷 的 残 基 总 数 等 于 带 正 


电 中 性 。 


成 员 带 正 电荷 的 残 基 总 数 大 于 带 


Ji. 电荷 dep 
有 25 ^ gk vA FJ rt f, ERLEBT LE FEL HIIR AE A 
负电 荷 的 残 基 总数 ， 


E 


参数 设 


H: 保 守 基 


WRKY 蛋白 的 二 级 结构 ( 张 春 兰 等 ，2018; 
49 种 WRKY 和 蛋白 的 三 级 结构 进行 预测 分 


个 物种 的 WRKY1 蛋白 
1987; 


EA, 2019, 沙 桐 等 ，2019) 搜 索 出 中 粒 咖啡 转 


构 和 理化 性 质 进行 汇总 及 


be 不 稳定 


£u 103~994 个 之 间 ， 氨基 酸 平 均 
系数 显示 Cc02_g05280 


不 稳定 系数 小 于 40 的 为 稳定 蛋白 )。 有 2 个 成 


分 别 是 Cc01_g14950 和 Cc07_g03120， 显 示 


数 ， 显 示 带 负电 荷 ， 有 22 个 
显示 市 带 正 电荷 ( 表 1). 


表 1 中 粒 咖 啡 WRKY 基因 家 族 的 蛋白 特征 


Table 1 Protein characteristics of WRKY gene family in Coffea canephora 


吕 肪 族 氨 基 

MEMMIUS wei 不 稳定 系数 pog 亚 细 胞 定位 

CcWRKY protein Number of Asp+Glu Arg+Lys Instability . . Subcellular 

Porn name amino acid pI index PS localization 

index 

Cc01 gl4950 © CcWRKYOI 545 7.05 58 58 67.75 48.13 ”细胞 核 Nuclear 
Cc01 g18730 — CcWRKYO02 343 9.62 29 50 60.7 68.8 细胞 核 Nuclear 
Cc02 g01860 — CCWRKYO3 333 6.71 40 39 45.71 69.37 ”细胞 核 Nuclear 
Cc02 g02240 | CcWRKYO04 270 8.95 24 29 64.87 50.3 细胞 核 Nuclear 
Cc02 g05270 | CcWRKYOS 333 6.71 40 39 45.77 69.37 ”细胞 核 Nuclear 
Cc02 g05280 | CcWRKYOG 139 5.85 18 16 3721 42.81 细胞 核 Nuclear 
Cc02_g15550 — CCWRKYO7 291 544 45 37 64.87 41.24 ”细胞 核 Nuclear 
Cc02_g22190 CcWRKY08 558 5.72 68 55 53.17 68.37 细胞 核 Nuclear 
Cc02 g25200 | CcWRKYOO 234 8.47 25 28 45.51 45.34 ”细胞 核 Nuclear 
Cc02 g38550 | CcWRKYIO 367 6.25 37 34 69.09 50 细胞 核 Nuclear 
Cc02 g38600 | CcWRKYII 235 8.73 21 24 62.12 79.19 ”细胞 核 Nuclear 
Cc02 g39120 | CcWRKYI2 367 5.26 54 43 47.86 60.03 ”细胞核 Nuclear 
Cc03_g00670 — CCWRKYI13 338 6.46 39 36 68.94 53.93 ”细胞核 Nuclear 
Cc04_g05080 | CCWRKY14 318 8.11 39 4l 46.83 66.54 ”细胞 核 Nuclear 
Cc04_g15400 — CcWRKYIS 524 6.84 47 46 49.41 62.58 ”细胞 核 Nuclear 
Cc05 g04000 — CcWRKYI6 622 6.63 58 53 42.83 64.37 ”细胞 核 Nuclear 
Cc05 g08580 | CcWRKYIT7 275 5.03 36 26 44.09 53.96 ”细胞 核 Nuclear 
Cc05 g09630 | CcWRKYIS 371 6.59 35 33 59.04 37.660 ”细胞 核 Nuclear 
Cc05 g14660 — CCWRKYI9 545 5.95 63 54 54.42 68.81 ”细胞核 Nuclear 
Cc05 g157900 | CCWRKY20 730 6.07 82 70 57.21 57.07 ”细胞 核 Nuclear 
Cc06 g02490 — CcWRKY21 298 6.39 32 30 50.27 59.87 ”细胞 核 Nuclear 
Cc06 g03470 | CcWRKY22 471 8.98 51 63 41.88 51.61 细胞 核 Nuclear 
Cc06_g15010 — CCWRKY23 517 7.16 65 65 52.84 53.73 ”细胞 核 Nuclear 
Cc07_g00980 | CcWRKY?24 199 9.6 18 28 47.71 62.21 细胞 核 Nuclear 
Cc07 903120 — CCWRKY25 507 6.99 51 51 55.6 62.6 细胞 核 Nuclear 
Cc07_g03730 — CCWRKY26 994 8.7 103 114 52.98 6742 ”细胞 核 Nuclear 
Cc07. 906340 — CCWRKY27 363 9.23 35 47 43.06 7223 细胞 核 Nuclear 
Cc07 g16400 — CcWRKY28 103 9.54 10 18 49.64 4146 ”细胞 核 Nuclear 
Cc07 g16570 — CCWRKY29 217 9.04 25 31 50.11 55.71 细胞 核 Nuclear 
Cc08 g06420 | CcWRKY30 336 9.57 28 43 43.23 59.223 细胞核 Nuclear 
Cc08 g07850 | CcWRKY3I 286 5.68 45 36 42.87 7129 ”细胞 核 Nuclear 
Cc08 g07860 | CcWRKY32 245 8.23 29 31 43.54 70.82 ”细胞 核 Nuclear 
Cc08 g11060 — CCWRKY33 183 547 26 22 517 35.68 ”细胞 核 Nuclear 
Cc08 g15270 — CcCWRKY34 352 5.73 46 38 55.81 61.22 ”细胞 核 Nuclear 
Cc08 g15200 | CcWRKY35 189 9.25 16 25 44.17 67.60 ”细胞 核 Nuclear 
Cc08 g15910 — CCWRKY36 342 5.74 37 30 57.86 62.19 ”细胞 核 Nuclear 
Cc09_g01430 CcWRKY37 554 6.48 55 52 46.06 61.01 细胞核 Nuclear 
Cc09 g03640 | CcWRKY38 485 6.2 62 55 5442 58. O8 ”细胞 核 Nuclear 
Cc09 g07330 | CcWRKY39 454 5.68 57 50 52.18 6126 ”细胞 核 Nuclear 
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Cc09 g08300 | CcWRKY40 180 8.43 15 17 73.83 51.39 ”细胞 核 Nuclear 
Cc09 g09190 — CCWRKY4I 304 6.56 37 35 66.02 55.16 ”细胞 核 Nuclear 
Cc10_g04810 — CCWRKY42 362 9.54 31 46 66.64 59.06 ”细胞 核 Nuclear 
Ccl0 g06400 CcWRKY43 105 9.05 13 18 37.63 62.19 ”细胞 核 Nuclear 
Ccll_g12210 | CcWRKY44 280 6.8 32 31 50.57 48.39 ”细胞 核 Nuclear 
Ccll gl2480 | CcWRKY45 526 73 54 55 61.09 53.78 ”细胞 核 Nuclear 
Ccll g17170 — CCWRKY46 191 9.54 16 25 4122 56.13 ”细胞 核 Nuclear 
Cc00 g06830 — CcWRKY47 561 6.79 72 69 46.12 6128 ”细胞 核 Nuclear 
Cc00 g138900 CcWRKY48 551 8.61 51 55 55.62 51.33 ”细胞 核 Nuclear 
Cc00 g21560 | CCWRKY49 534 7.52 51 52 5228 59.06 ”细胞 核 Nuclear 


根据 这 些 成 员 的 氨基 酸 组 成 进行 分 析 比 较 ， 结 果 显 示 ， 其 中 有 44 个 成 员 的 含量 最 高 的 氨基 
酸 为 丝氨酸 ,含量 在 7.5% 到 16.6% 之 间 ( 图 1:a,b,c)。 其 中 有 2 个 成 员 (Cc02_g38600 和 Cc03_g00670) 
的 含量 最 高 的 氨基 酸 为 有 峭 氨 酸 (图 1: d，e)，1 个 成 员 (Cc05_g04000) 的 含量 最 高 的 氨基 酸 为 天 冬 


酰胺 (图 1: D, 1 Cha ee uu a 1: g)，1 个 成 员 
(Cc10_g06400) 的 含量 最 高 的 氨基 酸 为 赖 氨 酸 ( 图 1: h)。 


A. KAR; R. AR N. 天 冬 酰胺 ; D. RAAR; C. 半 胱 氨 酸 ; Q. 谷 氨 酰胺 ; E. 124189; G. 甘氨酸 ; H. 组 氨 酸 ; 
L FEAR; L. RAR, K. MAR, M. EAR; F. AVE P. MAR; S. 丝氨酸 ; T. 苏 氨 酸 ; W. 色 氨 酸 ; Y. 
KAR, V. AR; a,b,c,d,e,f,g,h 分 别 代 表 Cc00_g13890, Cc01_g14950, Cc07_g03120, Cc02_g38600, Cc03_g00670, 
Cc05_g04000, Cc09_g01430 和 Cc10_g06400。 

A. Alanine; R. Arginine; N. Asparagine; D. Aspartic acid; C. Cysteine; Q. Glutarnine; E. Glutamicacid; G. Glycine; H. 


Histidine; I. Isoleucine; L. Leucine; K. Lysine; M. Methionine; F. Phenylalanine; P. Proline; S. Serine;T. Threonine; W. 
Tryptophan; Y. Tyrosine; a, b, c, d, e, f, g, h represent Cc00. g13890, Cc01. g14950, Cc07. g03120, Cc02, g38600, 
Cc03. g00670, Cc05. 04000, Cc09. 201430 and Cc10. g06400, respectively. 
图 1 氨基 酸 组 成 
Fig. 1 Amino acid composition 

2.2 AER RK K EA 

借助 于 在 线 工具 Protscale X ZE AHIT RAKIET 总体 分 布 来 看 ， 这些 转 录 因 子 氨 
基 酸 的 分 值 均 为 负 值 ， 表 明 它 们 都 是 亲 水 性 蛋白 。 可 以 看 出 49 种 WRKY 的 平均 亲 水 系数 介 1 
-1.196 和 -0.473 之 间 ， 表 明 其 都 是 杀 水 性 蛋白 。 最 大 疏水 性 数值 范围 是 0.289 和 2.589 之 间 ， 最 


大 的 是 Cc07_g03730 成 员 ， 最 小 的 是 Cc08_g11060 成 员 ， 最 小 疏水 性 数值 范围 是 -3.967 和 -2.511 


之 间 , 最 大 的 是 Cc02 g05280 RA, 最 小 的 是 Cc06_g03470 成 员 。 
系数 最 小 ， 说 明 其 亲 水 性 最 强 。 它 的 最 大 玻 水 性 


` 


M. 


是 104 个 ， 值 为 -3.811( 表 2). 


置 是 第 170 个 ， 


其 中 Cc08_g11060 的 平均 亲 水 
下 为 0.589; eK TEL BL 


表 2 中 粒 咖 啡 WRKY FERAT R i2 K PE Rudd 
Table 2 Prediction of hydrophilicity and hydrophobicity of WRKY transcription factors in Coffea 
canephora 

Tac KK TE 最 小 疏水 性 
蛋白 名 称 总 平均 疏水 指数 Maximum hydrophobicity Minimum hydrophobicity 
Protein name Total average hydrophobic index 位 置 数值 位 置 数值 

Position Value Position Value 
Cc00_g06830 -0.899 25 2.544 424 -2.989 
Cc00_g13890 -0.848 87 1.856 350 -3.400 
Cc00_g21560 -0.678 435 2.278 94 -3.256 
Cc01_g18730 -0.929 18, 19 1.689 28, 29 -3.200 
Cc01_g14950 -0.759 86 1.889 121 -3.344 
Cc02_g01860 -0.579 341 1.344 116 -2.833 
Cc02_g02240 -0.847 150 1.700 166, 167 -3.778 
Cc02_g05270 -0.579 30 1.578 100 -2.856 
Cc02_g05280 -0.856 106 1.289 17 -2.511 
Cc02_g15550 -1.030 204 1.456 277 -3.911 
Cc02_g22190 -0.618 469 2.311 30, 31 -3.544 
Cc02_g25200 -1.036 46 1.378 168 -2.622 
Cc02_g38550 -0.821 98 1.778 166, 167 -3.589 
Cc02_g38600 -0.526 72 1.333 161 -2.689 
Cc02. g39120 -0.674 58 1.467 108 -2.967 
Cc03. g00670 -0.875 62 1.711 158 -3.833 
Cc04. g05080 -0.810 301 1.800 96 -3.167 
Cc04. g15400 -0.628 429 2.278 144 -2.800 
Cc05. g04000 -0.738 570 2.367 234, 235 -3.511 
Cc05. g08580 -0.624 235 1.856 46 -2.900 
Cc05. g09630 -0.958 268 1.411 164 -3.444 
Cc05. g14660 -0.592 460 1.744 254 -2.800 
Cc05 g15790 -0.765 150 1.356 468 -3.311 
Cc06_g02490 -0.804 29 1.333 196, 270 -2.967 
Cc06_g03470 -0.908 31 1.533 356 -3.967 
Cc06_g15010 -0.913 64, 65 1.656 338 -3.444 
Cc07_g00980 -0.854 162 1.411 102 -3.333 
Cc07_g03120 -0.644 419, 420 2.122 12 -3.078 
Cc07_g03730 -0.523 246 2.789 847 -3.011 
Cc07_g06340 -0.473 278 1.578 49 -2.856 
Cc07_g16400 -0.925 89 1.011 54 -3.067 
Cc07_g16570 -0.858 44 1.700 203 -2.689 
Cc08_g06420 -0.601 5 1.622 202 -3.144 


E hi nai IV 
Cc08_g07850 -0.776 269 2.156 231 -2.844 
Cc08_g07860 -0.621 514 2.156 345, 346 -2.844 
Cc08_g11060 -1.196 170 0.589 104 -3.811 
Cc08_g15270 -0.691 307 1.767 144 -3.967 
Cc08_g15290 -0.614 53 1.456 118 -2.622 
Cc08_g15910 -0.709 252 2.267 219, 220 -3.222 
Cc09_g01430 -0.614 524 2.344 184, 185 -3.189 
Cc09_g03640 -0.927 211 1.178 452 -3.489 
Cc09_g07330 -0.782 201 1.578 412 -3.311 
Cc09_g08300 -0.678 120 1.289 106 -2.978 
Cc09_g09190 -0.826 243 1.256 13 -3.556 
Cc10_g04810 -0.742 278 1.544 115, 116 -2.978 
Cc10_g06400 -0.909 95 1.089 42 -2.744 
Ccll_g12210 -0.802 11 0.956 119 -2.900 
Ccll g12480 -0.832 116 1.433 378 -3.256 
Ccll g17170 -0.732 55 1.722 119 -2.689 


2.3 信和 号 肽 预测 及 亚 细 胞 定位 结果 

这 49 个 WRKY 蛋白 均 无 信号 肽 ， 推 测 其 为 非 分 泌 性 蛋白 。 分 别 对 49 种 WRKY 蛋白 进行 了 
亚 细 胞 定位 预测 ， 这 些 家 族 成 员 的 亚 细 胞 定位 ， 都 位 于 细胞 核 ( 表 1)， 说 明 CCWRKY 家 族 成 员 蛋 
白 亚 细 胞 定位 于 细胞 核 。 
2.4 编码 氨基 酸 的 跨 膜 结 构 分 析 

采用 TMHMM Server(v.2.0) 在 线程 序 ( 郑 超 等 ，2018) 分 析 中 粒 咖啡 WRKY 蛋白 的 跨 膜 结构 。 
可 以 看 到 WRKY 中 只 有 1 个 成 员 Cc02_g22190 和 蛋白质 序列 的 第 536 个 到 第 553 个 氨基 酸 之 间 有 
1 个 明显 跨 膜 区 域 ( 图 2)， 其 他 的 48 个 成 员 都 没有 跨 腊 区域， 推断 中 镁 咖啡 WRKY 不 属于 跨 膜 蛋 
白 。 
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图 2 中 粒 咖啡 WRKY(Cc02_g22190) 跨 膜 结 构 预测 
Fig. 2 Prediction of the transmembrane structure of WRKY(CcO2 222190) in Coffea canephora 
2.5 磷酸 化 位 点 分 析 
经 分 析 发 现 ， 这 49 种 WRKY 和 蛋白 中 丝 氮 酸 磷酸 化 位 点 数量 最 多 ， 其 次 是 苏 氨 酸 和 酷 氨 酸 。 
最 有 可 能 是 潜在 磷酸 化 位 点 的 氨基 酸 是 丝氨酸 ， 其 最 小 值 已 经 达到 0.849， 远 远 超过 标准 值 0.5, 
同时 这 一 结果 也 说 明 CcWRKY 基因 家 族 和 蛋白 可 能 通过 相应 位 点 的 磷酸 化 来 实现 其 功能 的 调控 。 其 


中 Cc07. g03730 成 员 的 丝氨酸 、 苏 氮 


和 12 个 ( 表 3)。 


酸 和 酷 氮 酸 磷酸 化 位 点 数量 是 最 多 的 ， 分 另 


表 3 中 粒 咖啡 49 种 WRKY 蛋白 磷酸 化 位 点 预测 
Table 3 Prediction of phosphorylation sites of 49 WRKY proteins in Coffea canephora 
ana A LAR KAR BURNS 

蛋白 名 称 Serine (S) Threonine (T) Tyrosine (Y) 

Protein name HOMES 
丝氨酸 苏 氨 酸 HAR ë RAE 位置 最 大 值 ME 最 大 值 位 
Serine (S) Threonine (T) Tyrosine (Y) Max. Position Max. Position Max. Position 

Cc00_g06830 44 20 6 0.998 6 0.996 387 0.834 240 
Cc00_g13890 69 21 8 0.998 368 0.968 374 0.953 229 
Cc00_g21560 63 19 3 0.998 152 0.909 176 0.922 390 
Cc01_g14950 57 19 12 0.972 185 0.959 367 0.984 528 
Cc01_g18730 31 6 1 0.981 223 0.967 69 0.742 284 
Cc02_g01860 41 17 4 0.995 80 0.973 175 0.786 313 
Cc02_g02240 33 10 5 0.993 TI 0.920 254 0.985 89 
Cc02. g05270 30 13 1 0.997 94,40 0.963 157 0.558 180 
Cc02. g05280 12 6 2 0.967 125 0.920 61 0.977 12 
Cc02. g15550 27 15 1 0.996 | 20,43 0.954 138 0.764 210 
Cc02. g22190 35 26 3 0.996 65 0.982 47 0.755 194 
Cc02. g25200 23 9 2 0.997 218 0.867 209 0.762 177 
Cc02. g38550 43 13 2 0.995 152,266 0.981 296 0.742 193 
Cc02, g38600 21 6 2 0.997 116 0.811 138 0.997 166 
Cc02_g39120 36 15 4 0.998 176 0.958 160 0.955 301 
Cc03_g00670 24 15 4 0.996 218 0.975 239 0.920 308 
Cc04_g05080 32 11 3 0.997 101 0.836 227 0.838 164 
Cc04_g15400 62 26 4 0.992 63 0.991 46 0.912 106 
Cc05_g04000 38 22 0 0.998 281 0.906 329 — — 
Cc05_g08580 23 19 3 0.994 29,40 0.917 135 0.980 181 
Cc05_g09630 34 13 8 0.993 166 0.811 30 0.929 304 
Cc05_g14660 50 21 4 0.995 177 0.982 260 0.953 198 
Cc05_g15790 57 23 6 0.994 355 0.932 518 0.942 319 
Cc06_g02490 36 10 4 0.991 280 0.920 177 0.940 118 
Cc06_g03470 35 19 6 0.992 258 0.906 55 0.823 439 
Cc06. g15010 47 16 4 0.995 18 0.829 203 0.974 48 
Cc07_g00980 14 7 2 0.994 159 0.870 91 0.820 177 
Cc07. g03120 55 20 4 0.997 376 0.909 170 0.781 287 
Cc07. g03730 83 39 12 0.997 138,988 0.988 872 0.931 576 
Cc07_g06340 39 13 3 0.990 45 0.908 12 0.816 292 
Cc07_g16400 9 3 2 0.954 11 0.652 66 0.987 62 
Cc07. g16570 14 8 3 0.991 162 0.951 54 0.762 144 
Cc08. g06420 42 11 3 0.995 227,207 0.941 231 0.875 331 
Cc08. g07850 25 8 2 0.997 129 0.798 16 0.950 114 


Cc08_g07860 21 4 1 0.996 31 0.570 101 0.814 91 


Cc08_g11060 18 2 6 0.995 93 0.900 113 0.988 166 
Cc08 g15270 33 16 4 0.992 278,341 0.979 45 0.846 23 
Cc08 g15290 10 8 2 0.993 105 0.863 106 0.762 114 
Cc08 g15910 27 14 10 0.996 174 0.860 184 0.947 10 
Cc09 201430 34 15 0 0.996 280 0.936 273 = == 
Cc09_g03640 36 14 2 0.998 171 0.871 267 0.963 61 
Cc09 207330 47 2] 1 0.997 446 0.935 278 0.546 56 
Cc09_g08300 17 8 2 0.972 157 0.975 71 0.920 150 
Cc09_g09190 24 14 7 0.969 204 0.978 192 0.829 10 
Cc10_g04810 40 9 3 0.951 181 0.676 129 0.839 52 
Cc10_g06400 5 3 1 0.849 37 0.741 16 0.973 67 
Cc11_g12210 27 12 1 0.879 135 0.893 133 0.663 144 
Cc11_g12480 35 20 2 0.969 214 0.894 169 0.845 237 
Cc11_g17170 17 9 2 0.996 152 0.822 80 0.865 100 


2.6 编码 蛋白 的 二 、 三 级 结构 预测 分 析 

和 蛋白质 的 二 级 结构 主要 是 指 蛋 白质 的 多 肽 链 中 有 规则 重复 的 构象 , 从 CceWRKY 家 族 成 员 的 蛋 
白 二 级 结构 分 析 可 以 看 出 ，CcWRK7 基因 家 族 的 二 级 结构 主要 由 无 规则 卷曲 、ou- 螺 旋 、B- 转 角 和 
延伸 链 组 成 ， 这 4 种 蛋白 质 的 二 级 结构 元 件 通 常 被 主要 研究 ( 张 春 兰 等 ，2018)， 通 过 预测 和 数据 
分 析 将 更 容易 了 解 到 蛋白 的 空间 结构 。 其 中 无 规 卷曲 所 占 比例 较 高 ， 其 功能 主要 起 连接 其 他 二 级 
结构 元 件 ， 达 到 了 46.67%~77.26%，B- 转 角 在 二 级 结构 中 占 比 均 较 小 。CcWRKY 基因 家 族 的 二 级 
结构 较 整齐 ， 除 Cc00_g06830、Cc05_g14660、Cc07_g16400、Cc08_g11060 和 Cc10_g06400 是 无 
规则 卷曲 > 延伸 链 >a- 螺 旋 >B- 转 角 外 ， 其 余 基 因 家 族 成 员 均 是 无 规则 卷曲 >a- 螺 旋 > 延 伸 链 >B- 转 角 
( 表 4， 图 3)。 


表 4 中 粒 咖 啡 WRKY 基因 家 族 的 二 级 结构 分 析 统 计 表 
Table 4 Statistical table of secondary structure analysis of WRKY gene family in Coffea canephora 


蛋白 名 称 a- 螺 旋 (X9%)* IREX D)? B- 转 角 (X9%)" 无 规则 卷曲 (X96)” 
Protein name a-helix Extended chain p-turn Random coil 
Cc00. g06830 63(11.2396) 79(14.0896) 31(5.5396) 388(69.16%) 
Cc00_g13890 67(12.03%) 57(10.23%) 17(3.05%) 416(74.69%) 
Cc00_g21560 110(20.60%) 61(11.42%) 12(2.25%) 351(65.73%) 
Cc01_g14950 58(10.64%) 53(9.72%) 14(2.57%) 420(77.06%) 
Cc01_g18730 86(25.07%) 31(9.04%) 12(3.50%) 214(62.39%) 
Cc02_g01860 76(20.16%) 41(10.88%) 14(3.7196) 246(65.2590) 
Cc02, g02240 69(25.56906) 13(4.81%) 9(3.33%) 179(66.30%) 
Cc02_g05270 89(26.73%) 30(9.01%) 12(3.60%) 202(60.66%) 
Cc02, g05280 31(22.3096) 19(13.6796) 13(9.3596) 76(54.68%) 
Cc02_g15550 42(14.43%) 25(8.59%) 8(2.75%) 216(74.23%) 
Cc02_g22190 174(31.18%) 59(10.57%) 12(2.15%) 313(56.09%) 
Cc02_g25200 49(20.94%) 41(17.52%) 13(5.56%) 131(55.98%) 
Cc02, g38550 100(27.2596) 30(8.1796) 14(3.8196) 223(60.76%) 
Cc02_g38600 67(27.23%) 46(19.57%) 11(4.68%) 114(48.51%) 


Cc02_g39120 71(19.35%) 40(10.90%) 12(3.27%) 244(66.49%) 


Cc03_g00670 58(17.16%) 41(12.13%) 19(5.62%) 220(65.09%) 


Cc04_g05080 93(29.25%) 38(11.95%) 4(1.26%) 183(57.55%) 
Cc04_g15400 97(18.51%) 62(11.83%) 10(1.91%) 355(67.75%) 
Cc05_g04000 147(23.63%) 74(11.90%) 14(2.25%) 387(62.22%) 
Cc05_g08580 29(10.55%) 28(10.18%) 8(2.91%) 210(76.36%) 
Cc05_g09630 60(17.80%) 33(9.79%) 14(4.15%) 230(68.25%) 
Cc05_g14660 33(6.06%) 75(13.76%) 19(3.49%) 418(76.70%) 
Cc05_g15790 81(11.10%) 65(8.90%) 20(2.74%) 564(77.26%) 
Cc06_g02490 72(24.16%) 36(12.08%) 11(3.69%) 179(60.07%) 
Cc06_g03470 74(15.71%) 50(10.62%) 20(4.25%) 327(69.43%) 
Cc06_g15010 100(19.34%) 63(12.19%) 22(4.26%) 332(64.22%) 
Cc07. g00980 60(30.1590) 30(15.0896) 18(9.0596) 91(45.7396) 

Cc07. g03120 108(21.3090) 52(10.26906) 14(2.7696) 333(65.6896) 
Cc07. g03730 267(26.8696) 178(17.9190) 78(7.8596) 471(47.3890) 
Cc07. g06340 81(22.3190) 24(6.6196) 9(2.48%) 249(68.60%) 
Cc07. g16400 13(12.6296) 23(22.3396) 12(11.6596) 55(50.4096) 

Cc07. g16570 59(27.1990) 28(12.9096) 8(3.6996) 122(56.2296) 
Cc08. g06420 71(21.1396) 35(10.42%) 16(4.76%) 214(63.69%) 
Cc08_g07850 92(32.17%) 34(11.89%) 10(3.50%) 150(52.45%) 
Cc08_g07860 61(24.90%) 30(12.24%) 6(2.5%) 148(60.41%) 
Cc08_g11060 27(14.75%) 38(20.77%) 17(9.29%) 101(55.19%) 
Cc08_g15270 100(28.4196) 30(8.5296) 15(4.2696) 207(58.8196) 
Cc08 g15290 41(21.6990) 24(12.7096) 10(5.2990) 114(60.3296) 
Cc08 g15910 72(21.0596) 37(10.8296) 11(3.22%) 222(64.91%) 
Cc09_g01430 154(27.80%) 51(9.21%) 16(2.89%) 333(60.11%) 
Cc09_g03640 65(13.40%) 58(11.96%) 16(3.30%) 346(71.34%) 
Cc09_g07330 93(20.48%) 44(9.6%) 17(3.74%) 300(66.08%) 
Cc09_g08300 33(18.33%) 20(11.11%) 9(5.00%) 118(65.56%) 
Cc09 g09190 64(21.0596) 26(8.5596) 4(1.3296) 210(69.0890) 
Cc10 g04810 75(20.72%) 34(9.39%) 10(2.76%) 243(67.13%) 
Cc10, g06400 18(17.1490) 25(23.8190) 13(12.3896) 49(46.6790) 

Ccll g12210 38(13.57906) 31(11.07%) 12(4.29%) 199(71.07%) 
Cc11_g12480 73(13.8896) 60(11.4196) 13(2.4796) 380(72.2496) 
Ccll g17170 46(24.0890) 31(16.2396) 11(5.7696) 103(53.9396) 


1E: ^ 表 示 o- E Fi LER E ATRA EC; P ez SERRE AEA ARAE; KR B- 转 角 占 该 蛋 
二 级 结构 的 比例 ;? 表示 无 规则 卷曲 占 该 蛋白 总 二 级 结构 的 比例 。 


Note: ^represents the ratio of a-helix to the total secondary structure of the protein, P represents the ratio of the extended 


Bk 


n 


chain to the total secondary structure of the protein, © represents the ratio of the -turn to the total secondary structure of 
the protein, and P represents the random coil to the total secondary structure of the protein. 

分 析 发 现 中 粒 咖啡 WRKY 转录 因子 基因 家 族 和 蛋白 的 三 级 结构 可 以 分 为 6 类， 分 别 以 A、B、 
C、D、E 和 F 表 示 。 其 中 ，D 类 成 员 最 多 ， 有 25 个 ;其 次 是 A 类 ， 有 9 个 成 员 ; E 类 含有 7 个 
成 员 ，B 类 含有 4 个 成 员 ，C 类 含有 3 TAA: 最 少 的 是 类， 只 有 一 个 成 员 。 从 三 级 结构 稳定 
性 来 看 ， 结 构 稳定 从 强 到 弱 的 顺序 为 ED、E>A>C>B。 其 中 ，Cc07_g03730 以 c5yvfD 结构 为 模 
板 ， 有 315 个 氨基 酸 残 基 与 模板 高 达 100% 的 可 信和 度 ; Cc05_g08580 以 c2aydA 结构 为 模板 ， 有 75 


202008.00020v1 


chinaXiv 


个 氨基 酸 残 基 与 模板 达到 100% 的 可 信 度 (图 4). 
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红色 线条 代表 延伸 链 ; 蓝 色 线条 代表 a- 螺 旋 ; 紫色 线条 代表 无 规则 卷曲 ; 绿色 线条 代表 -转角 。 


Red lines represent extended strand; Blue lines represent a-helix; Purple lines represent random coil; Green lines 


represent p-turn. 


图 3 中 粒 咖啡 WRKY 基因 家 族 二 级 结构 分 析 


Fig. 3 Secondary structure analysis of WRKY gene family in Coffea canephora 
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A, B, C, D, E, F 分 别 表示 Cc05 g08580, Cc02, g05270, Cc09. 207330, Cc06. 02490, Cc03. g00670, Cc07. 03730. 
A, B, C, D, E, F represent Cc05. g08580, Cc02. g05270, Cc09 907330, Cc06. 02490, Cc03. g00670, Cc07. g03730, 


respectively. 
图 4 三 级 结构 模型 
Fig. 4 Tertiary structure model 
2.7 氨基 酸 序列 结构 域 进行 分 析 
借助 于 MEME 在 线 工 具 搜 索 中 粒 咖啡 WRKY 基因 家 族 成 员 的 Motif， 根 据 其 保守 性 的 强 弱 ， 


依次 命名 为 Motif1~Motif6。 由 序列 logo 可 以 看 出 , WRKYGQK 七 肽 序列 的 基 序 分 别 存在 于 Motif 


1 和 Motif 5 P, WRKY 基因 家 族 49 个 成 员 均 具有 Motifl 和 Motif2， 推 测 Motifl 是 WRKY 结构 
域 。 每 个 成 员 至 少 都 含有 1 个 WRKY 七 肽 ， 其 中 最 多 的 有 5 个 保守 基 序 ， 最 少 的 有 2 个 保守 基 


FF. 19 个 成 员 只 有 Motifl 和 Motif2; 有 7 个 成 员 含 有 Motifl. Motif2. Motif4, Motif5 和 Motif6( 民 
5, K5) 
2.8 中 粒 咖啡 WRKY 蛋白 的 系统 发 育 树 的 构建 

对 WRKY 基因 家 族 成 员 和 蛋白 序列 进行 多 重 比 对 分 析 ， 将 下 载 的 49 个 家 族 成 员 和 蛋白 序列 输入 
MEGA 绘制 出 中 粒 咖啡 WRKY 蛋白 的 进化 树 (图 6)。 从 进化 树 的 聚 类 结果 可 以 清晰 地 看 出 这 49 
个 成 员 分 成 了 6 组 (依次 称 为 Group 1, Group 2, Group 3, Group 4, Group 5 和 Group 6)。 其 中 Group 
1 成员 最 多 [14 个 , WRKY 12, 13, 23, 28, 48, 50, 51 (Cc07-g16400 和 Cc10-g06400), 56 (Cc02-g38600 
和 Cc08-g15290), 57, 71 和 75 (Cc07-g00980 和 Cc11-g17170)]. 约 占 总 数 的 28.4%; 其 次 是 Group 2 
[10 ^, WRKY 1, 2, 4, 20, 32, 33 (Cc00-g13890 和 Cc01-g14950), 34 和 44]、Group 5 [10 个 , WRKY 7 
(Cc07-g0634 fill Cc10-g04810), 11, 21, 22 (Cc02-g38500 和 Cc08-g15270), 27, 35, 65 和 69] fll Group 3 
[9 个 , WRKY 7 (Cc05-g04000 和 Cc09-g01430), 9, 40 (Cc04-g05080, Cc08-g07850 和 Cc08-g07860), 
61 和 72(Cc00-g21560 和 Cc07-g03120)]; 剩余 2 组 成 员 均 较 少 ，Group 6 有 5 个 [WRKY 41 
(Cc02-g01820, Cc02-g39120 和 Cc08-g15910), 55 £41 70]， 而 Group 4 仅 有 1 个 (WRKY 49) (X 1). 


Tu 


从 进化 树 分 支 关系 ! 


还 可 以 得 H 


H Group 1、Group 2. Group 3. Group 4 f 
组 ， 说 明 它们 的 亲缘 关系 较 近 ， 而 Group 6 与 它们 的 关系 较 远 ， 因 


Jk, fü 


Il Group 5 聚 类 到 为 一 大 


EMI] Group 6 成 员 可 能 是 
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在 物种 长 期 遗传 进化 过 程 中 非常 保守 ， 且 与 祖先 关系 最 相似 的 一 类 而 被 保留 下 来 的 。 
分 析 进 化 树 分 组 结果 后 ， 采 取 家 族 成 员 分 组 比 对 的 方法 ， 发 现 每 组 的 保守 和 氨基酸 呈 多 样 性 ， 

但 值得 惊奇 的 是 所 有 组 都 具有 WRKY 保守 基 序 ， 参 考 Eulgem et al.(2000) 分 类 标准 ， 将 得 到 的 49 
个 WRKY 基因 家 族 成 员 分 为 3 类 : Group 2 (D731-H785、D943-H998) 属 于 WRKY 第 I 家族， 它 
含有 2 个 保守 的 七 肽 结构 (WRKYGQK) 和 2 个 锌 指 结构 (C2H2 型 );，Group 6 (D151-C209) 属 于 
WRKY 第 II 家 族 ， 它 含有 1 个 保守 的 七 肽 结构 (WRKYGQK) 和 1 个 锌 指 结构 (C2HC 型 )( 巴 德 仁 贵 
等 ，2017)。 Group 1 (D20s-H260)、Group 3 (D3s9-H415)~ Group 4 (Dis1-H206)、 Group 5 (Dz18-H274 或 
P316-H374) 含 有 1 个 保守 的 WRKY 结构 域 和 1 个 CsH 锌 指 型 结构 域 , 被 归 为 WRKY 58 I OCA 
7)。 


序列 Sequence E 值 E-value 方 框图 Block diagram 序列 Sequence E 值 E-value 方 框图 Block diagram 
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Fig. 5 Conservative motif analysis of WRKY protein family in Coffea Canephoea 
K 5 保守 基 序 序列 logo 


Table 5 Sequence logo of the conservative motifs 


Motif 命名 序列 标志 


Motifname Sequence logo 
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图 6 中 粒 咖啡 WRKY 蛋白 的 系统 发 育 树 
Fig. 6 Phylogenetic tree of WRKY proteins in Coffea canephora 
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7 氨基 酸 序列 比 对 
Fig.7 Amino acid sequence alignment 
2.9 中 粒 咖啡 转录 因子 WRKY 与 其 他 物种 间 的 系统 进化 分 析 
为 进一步 分 析 中 粒 咖啡 WRKY 基因 的 亲缘 关系 和 进化 模式 ， 选 取 拟 南 草 、 玉 米 和 狂 猴 桃 等 
12 个 物种 的 转录 因子 WRKY1 蛋白 序列 进行 同 源 聚 类 分 析 。 使 用 MEGA 软件 进行 系统 发 生 树 的 
构建 ， 进 化 树 结果 表明 ， 中 粒 咖啡 与 11 个 物种 的 WRKYI 转录 因子 家 族 成 员 可 分 为 2 个 分 文 ， 烟 
草 、 中 粒 咖啡 、 猕 猴 桃 、 拟 南 芥 、 板 票 、 训 和 苹果 在 第 1 个 分 文 ， 而 玉米 、 水 稻 、 毛 竹 、 小 果 野 
磋 、 非 洲 油 棕 在 第 2 个 分 支 。 在 第 1 ADLA, PAME WRKY 与 烟草 亲缘 关系 最 近 ， 序 列 同 
源 性 最 高 ， 其 次 与 猕猴 桃 亲缘 关系 较 近 ; 与 非洲 油 标 亲 缘 关 系 最 远 。 从 双子 叶 角 度 来 看 ， 中 粒 咖 
啡 与 猕猴 桃 、 烟 草 、 拟 南 芥 、 板 票 、 刺 和 苹果 这 些 植物 聚 类 在 一 大 类 ， 符 合 双 子叶 分 类 标准 ;而 
单子 叶 玉 米 、 水 稳 、 毛 竹 、 小 果 野 燕 和 非洲 油 标 聚 类 在 男 一 大 类 。 这 表明 双子 时 和 单子 叶 植 物 得 
传 进 化 具有 很 明显 的 分 界线 。 从 乔 本 类 植物 的 角度 来 看 ， 中 粒 咖啡 WRKYI 与 猕猴 桃 的 亲缘 关系 
最 近 ， 与 非洲 油 标 关 系 最 远 ， 从 草本 类 植物 来 看 ， 中 粒 咖啡 WRKYI 与 烟草 的 亲缘 关系 最 近 ， 与 
水 稻 关系 最 远 (图 8)。 
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图 8 中 粒 咖 啡 与 其 他 物种 的 WRKYT 蛋白 进化 树 分 析 


Fig. 8 Evolutionary tree analysis of WRKY 1 protein of Coffea canephora and other species 


3 讨论 与 结论 


WRKY 转录 因子 在 植物 界 中 是 通过 其 保守 的 氨基 酸 序 列 (WRKYGQRK) 特 异 识别 诅 基 因 的 启动 
子 区 域 W-box [(T)TGACC(AT)]， 并 且 调 控 靶 基因 的 转录 表达 ( 梁 滨 和 董 冬 ，2018)。 有 研究 报道 了 


已 经 成 功 的 鉴定 和 挖 气 了 AtWRKY 和 OsWRKY 基因 家 族 的 生物 学 特征 和 分 子 功能 (Rushton et al., 
2010; 谷 彦 冰 等 ，2015)。WRK7Y 基因 家 族 在 种 子 萌发 的 过 程 、 
育 衰 老 调 控 等 生命 过 程 中 都 起 到 重要 作用 ( 梁 滨 和 董 冬 ， 


植物 防卫 应 答 反应 、 代 谢 调 控 和 发 
2018)。 在 拟 南 芥 WRKY 抗 病 转录 因子 研 


AP, 发现 WRKY 家 族 因子 能 在 


定 程 度 上 提高 耐 受 低 磷 胁迫 的 能 力 ， 对 腐生 病原 菌 起 正 调控 作 


用 的 为 AtrWRKY3 fll ArWRKY4(Lai et aL, 2008; 陈 益 芳 等 ,2010); 在 烟草 云烟 87? 叶 片 衰老 中 WRKY 


转录 因子 研究 中 得 出 对 衰老 的 影响 ;烟草 在 植 4 


是 参与 机 械 损伤 胁迫 和 病原 菌 侵 染 的 重要 组 分 ( 刘 唱 晶 等 ， 


OREJA EHZ ALIENAR, HEW NIWRKY40 可 能 
2016)。 在 猕猴 桃 涝 害 胁 人 迫 研究 中 指出 


WRKY 在 猕猴 桃 对 涝 害 胁 迫 反 应 有 起 到 重要 作 


用 ( 张 计 育 等 ，2015)。 在 研究 表 WRKY 转录 因子 对 


枣 疯 病 植 原 体 和 激素 处 理 的 应 答 中 ,指出 束 疯 病 植 原 体 侵 染 束 树 后 ,诱导 了 ZjWRKYS、ZjWRKY52、 


ZjWRKY61 和 ZiWRKY69 基因 的 表达 ( 付 冰 等 ， 


2018)。 在 苹果 的 盐 胁 迫 研究 中 得 出 ,MaWRKYI18 


和 MdWRKY40 受 盐 胁迫 的 诱导 , 可 以 形成 同 源 或 异 源 二 聚 体 , 并 增强 对 盐 胁迫 的 耐性 ( 许 海峰 等 ， 
2018)。 总 之 ，WRK7 转录 因子 在 直接 参与 植物 的 生命 活动 中 具有 不 可 忽视 的 关键 作用 (Gao et al., 


2016). 
本 研究 分 析 发 现 ,中 粒 咖啡 WRKY KIE 


白 的 氨基 酸 总 数 在 103-994 个 之 间 , 氨基 酸 平 均 为 


五 


376 个 ， 等 


Bm ys 5.03-9.62. 。 这 与 同 源 性 较 高 的 吏 ( 薛 宝 平 等 ，2018)、 苹 果 (Bhattarai， 


2010)WRKY 转录 因子 研究 的 结果 是 相似 的 ， 并 且 发 现 中 粒 咖 啡 WRKY 家 族 蛋 白 都 是 不 含 跨 膜 结 


构 域 的 亲 水 性 稳定 重 白 ， 都 无 信号 肽 ， 亚 引 


胞 定位 都 在 细胞 核 中 ， 说 明 该 蛋白 是 在 细胞 内 合成 后 


运输 到 细胞 核 后 起 作用 ; WRKY 蛋白 在 丝氨酸 


、 苏 氨 酸 及 酷 氨 酸 处 都 有 磷酸 化 位 点 ， 推 测 该 蛋白 


是 通过 磷酸 化 来 实现 其 功能 的 调控 。 二 级 结构 预测 分 析 和 三 级 结构 预测 分 析 ，49 种 WRKY 转录 
因子 的 二 级 结构 均 主 要 以 无 规则 卷曲 为 主 ， 三 级 结构 可 以 分 为 6 类 ， 其 中 以 D 类 为 主 。 有 研究 表 
Hj, ArWRKY 61 有 可 能 参与 植物 免疫 信号 通路 (Robatzek et al., 2002); 通过 与 ArWRKY72 共同 参与 
植物 的 抗 病 信号 通路 (Bhattarai，2010); 拟 南 芥 中 WRKY6 参与 到 植物 防卫 反应 及 叶片 的 衰老 过 程 
中 (Robatzek et al., 2002); AtWRKY7 参与 了 拟 南 芥 的 天 然 免 疫 反应 (Journot-Catalino et al., 2006). 
从 中 粒 咖啡 WRKY 蛋白 的 三 级 结构 来 看 ，D 类 比较 稳定 ， 通 过 对 蛋白 序列 比 对 拟 南 芥 WRKY 序 
列 找 出 中 粒 咖啡 转录 因子 WRKY 基因 家 族 成 员 的 对 应 关系 ( 表 1)， 发 现 D 类 中 有 与 AtWRKY61、 
AtWRKY72. AtWRKY6 和 AtWRKY7 对 应 关系 ， 推 测 中 粒 咖啡 WRKY 可 能 参与 植物 免疫 信和 号 通路 、 
植物 的 抗 病 信 号 通路 ， 也 可 能 参与 到 植物 防卫 反应 及 叶片 的 衰老 与 天 然 免疫 反应 的 过 程 中 。 由 保 
守 结 构 域 预测 分 析 可 以 看 出 ，Cc00_g01860 、Cc00_g05270 、Cc00_g05280 、Cc00_g39120 和 
Cc08 g15910, 5 个 成 员 保守 基 序 只 含有 2 个 ， 分 别 为 Motifl 与 Motif2， 可 以 将 它们 分 为 1 个 大 
类 ， 这 与 WRKY 和 蛋白 构建 进化 树 的 结果 是 一 致 的 ， 这 些 成 员 都 在 Group 6。WRKY 结构 域 既 含 
保守 的 七 肽 结构 (WRKYGQK)， 还 包含 1 个 锌 指 结构 (C2HC)， 而 且 C2HC 结构 只 存在 HL 家 族 的 
WRKY 结构 域 ( 李 晓 颖 等 ，2019)， 这 与 在 束 等 ( 薛 宝 平 等 ，2018) 其 他 物种 上 的 研究 结果 相似 。 从 
进化 分 析 研究 表明 ， 中 粒 咖啡 WRKY 转录 因子 家 族 蛋 白 序列 可 以 分 为 6 组 ， 中 粒 咖啡 WRKYI 基 
因 与 烟草 、 猕猴桃 和 拟 南 芥 等 11 种 物种 构建 的 系统 进化 树 可 以 得 到 中 粒 咖啡 WRKYI 与 烟草 亲缘 
关系 最 近 ， 序 列 同 源 性 也 较 高 ， 与 非洲 油 棕 亲 缘 关 系 最 远 。 

本 研究 利用 生物 信息 学 手段 在 中 粒 咖 啡 基因 组 中 发 现 49 个 WRKY 基因 ， 对 该 家 族 基因 编码 
蛋白 的 理化 性 质 、 磷 酸化 位 点 、 跨 膜 结构 、 二 级 和 三 级 结构 、 功 能 结构 域 和 分 子 进化 等 进行 了 详 
细 地 生物 信息 学 分 析 ， 为 后 续 研 究 中 粒 咖啡 WRKY 分 子 功能 、 进 化 起 源 关系 及 其 逆境 胁迫 机 制 提 
供 一 定 的 理论 依据 和 参考 价值 ( 巴 德 仁 贵 等 ，2017)。 
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